智能论文笔记

Accelerating Deep Learning Model Inference on Arm CPUs with Ultra-Low Bit Quantization and Runtime

Saad Ashfaq , MohammadHossein AskariHemmat , Sudhakar Sah , Ehsan Saboori , Olivier Mastropietro , Alexander Hoffman

分类：机器学习 | 人工智能

2022-07-18

深度学习一直是近来最具破坏性的技术进步之一。深度学习模型的高性能以高度计算，存储和功率要求为代价。感知到加速和压缩这些模型以提高设备性能的直接需求，我们引入了Deeplite Neutrino，以便对模型的生产优化和Deeplite运行时进行介绍，以在基于ARM的平台上部署超低位量化模型。我们为ARMV7和ARMV8架构实施低级量化内核，可在32位和64位基于ARM的设备上进行部署。通过使用矢量化，并行化和平铺的有效实现，与具有XNNPACK后端的TensorFlow Lite相比，我们在分类和检测模型上分别实现了高达2倍和2.2倍的速度。与ONNX运行时相比，我们还获得了高达5倍和3.2倍的显着加速，分别用于分类和检测模型。

translated by 谷歌翻译

Depression Symptoms Modelling from Social Media Text: An Active Learning Approach

Nawshad Farruque , Randy Goebel , Sudhakar Sivapalan , Osmar Zaiane

分类：自然语言处理 | 人工智能 | 机器学习

2022-09-06

基于社交媒体语言的临床抑郁模型的基本组成部分是抑郁症状检测（DSD）。不幸的是，没有任何DSD数据集都反映出自lif污抑郁症的样本中抑郁症状的临床见解和分布。在我们的工作中，我们描述了一个主动学习框架（AL）框架，该框架使用了最初的监督学习模型1）1）最先进的大型心理健康论坛文本文本预训练的语言模型在临床医生注释的临床医生上进行了微调DSD数据集，2）DSD的零拍学习模型，并将它们融合在一起，从我们大型自我策划的抑郁症推文存储库（DTR）中收获抑郁症状相关的样本。我们的临床医生注释的数据集是同类数据集中最大的数据集。此外，DTR是由自披露的抑郁用户在两个数据集中的Twitter时间轴中创建的，其中包括从Twitter中检测到用户级抑郁症的最大基准数据集之一。这进一步有助于保留自张开的Twitter用户推文的抑郁症状分布。随后，我们使用收获的数据迭代地重新训练我们的初始DSD模型。我们讨论了该过程的停止标准和局限性，并阐述了在整个AL过程中起着至关重要的作用的基础构造。我们证明我们可以生产最终的数据集，这是同类产品中最大的数据集。此外，对其进行训练的DSD和抑郁症检测（DPD）模型的精度明显优于初始版本。

translated by 谷歌翻译

Feature diversity in self-supervised learning

Pranshu Malviya , Arjun Vaithilingam Sudhakar

分类：机器学习 | 人工智能

2022-09-02

许多关于缩放定律的研究考虑了基本因素，例如模型大小，模型形状，数据集大小和计算功率。这些因素很容易调整，代表了任何机器学习设置的基本要素。但是研究人员还采用了更复杂的因素来估计测试误差和概括性能，并具有高可预测性。这些因素通常针对域或应用。例如，特征多样性主要用于Chen等人促进SYN到真实传递。（2021）。由于以前的作品中定义了许多缩放因素，研究这些因素如何在使用CNN模型的自我监督学习的背景下如何影响整体概括性能。个体因素如何促进概括，其中包括不同的深度，宽度或早期停止的训练时期的数量？例如，较高的特征多样性是否导致在SYN到真实传输以外的复杂环境中保持较高的精度？这些因素如何互相取决于彼此？我们发现最后一层是整个培训中最多样化的。但是，尽管模型的测试误差随着时代的增加而减少，但其多样性下降。我们还发现多样性与模型宽度直接相关。

translated by 谷歌翻译

Design and Analysis of Cold Gas Thruster to De-Orbit the PSLV Debris

Roshan Sah , Raunak Srivastava , Kaushik Das

分类：机器人

2022-08-07

如今，太空世界的主要关注点是太空碎片的不受控制的生长及其与航天器碰撞的可能性，尤其是在低地轨道（LEO）区域。本文的目的是设计优化的微螺旋液系统，即冷气油推进器，以将PSLV碎片从668公里到250公里的高度将其除外。推进系统主要由储罐，管道，控制阀和收敛发散的喷嘴组成。本文根据连续的迭代过程给出了每个组件设计的想法，直到满足设计推力要求为止。所有组件均在CATIA V5中设计，并且在每个组件的ANSYS工具中进行了结构分析，我们的气缸箱可以承受其壁上产生的高箍应力。通过使用k-$ \ epsilon $湍流模型进行CD喷嘴的k-$ \ epsilon $回到地球的气氛并燃烧。 Hohmann \的轨道转移方法已被用于除向PSLV空间碎片，并通过STK工具对其进行了模拟。结果表明，我们优化的设计推进器会产生足够的推力，以将PSLV碎片偏离非常低的轨道。

translated by 谷歌翻译

Privacy-Preserving Action Recognition via Motion Difference Quantization

Sudhakar Kumawat , Hajime Nagahara

分类：计算机视觉

2022-08-04

我们个人空间中智能计算机视觉系统的广泛使用导致人们对这些系统构成的隐私和安全风险的意识增加了。一方面，我们希望这些系统通过理解周围环境来帮助我们的日常生活，但另一方面，我们希望它们这样做而不捕获任何敏感信息。朝这个方向发展，本文提出了一个名为BDQ的简单而强大的隐私保护编码器，用于保护隐私保护人类行动识别的任务，该任务由三个模块组成：模糊，差异和量化。首先，输入场景传递到模糊模块以使边缘平滑。接下来是差异模块，以在连续帧之间应用像素强度减法以突出运动特征并抑制明显的高级隐私属性。最后，将量化模块应用于运动差框架以删除低级隐私属性。 BDQ参数以端到端方式通过对抗训练进行了优化，以便学会允许行动识别属性，同时抑制隐私属性。我们在三个基准数据集上进行的实验表明，与以前的作品相比，建议的编码器设计可以实现最新的权衡。此外，我们表明实现的权衡与基于DVS传感器的活动摄像机相当。代码可在：https：//github.com/suakaw/bdq_privacyar。

translated by 谷歌翻译

Sign Language Recognition System using TensorFlow Object Detection API

Sharvani Srivastava , Amisha Gangwar , Richa Mishra , Sudhakar Singh

分类：计算机视觉 | 人工智能 | 机器学习

2022-01-05

通信被定义为分享或交换信息，想法或感受的行为。为了建立两个人之间的沟通，他们都需要了解和解共同语言。但在聋人和愚蠢的情况下，通信手段是不同的。聋是无法听到的，愚蠢是无法说话的。他们在自己之间使用手语和正常的人进行沟通，但正常的人不会认真对待手语的重要性。不是每个人都拥有对手语的知识和理解，这使得正常人与聋人和愚蠢的人之间的沟通困难。为了克服这一屏障，可以建立基于机器学习的模型。可以培训模型以识别手语的不同手势并将其转化为英语。这将有助于很多人与聋人和愚蠢的人交流和交谈。现有的印度唱歌语言识别系统是使用单手和双手手势的机器学习算法设计的，但它们不是实时的。在本文中，我们提出了一种使用网络摄像机创建印度手语数据集的方法，然后使用传输学习，训练TensorFlow模型以创建实时标志语言识别系统。即使使用有限的数据集，系统也可以实现良好的准确度。

translated by 谷歌翻译

Sentiment Analysis and Sarcasm Detection of Indian General Election Tweets

Arpit Khare , Amisha Gangwar , Sudhakar Singh , Shiv Prakash

分类：自然语言处理 | 机器学习

2022-01-03

社交媒体使用量增加到今天的数字世界中的历史新高。大多数人口使用社交媒体工具（如Twitter，Facebook，YouTube等）与社区分享他们的思想和经验。分析共同公众的情绪和意见对政府和商界人士来说非常重要。这是在大选时间进行各种民意调查中的大量媒体机构激活的原因。在本文中，我们曾在2019年Lok Sabha选举期间分析了印度人民的情绪，使用该持续时间的推特数据。我们建立了一个自动推文分析仪，使用传输学习技术来处理这个问题的无监督性质。我们在我们的机器学习模型中使用了线性支持向量分类方法，此外，术语频率逆文档频率（TF-IDF）方法用于处理推文的文本数据。此外，我们提高了模型的能力，以解决一些用户发布的讽刺推文，其中一些用户尚未被该领域的研究人员考虑。

translated by 谷歌翻译

Simple Text Detoxification by Identifying a Linear Toxic Subspace in Language Model Embeddings

Andrew Wang , Mohit Sudhakar , Yangfeng Ji

分类：自然语言处理 | 机器学习

2021-12-15

大型预训练的语言模型通常受到大量互联网数据的培训，其中一些可能包含有毒或滥用语言。因此，语言模型编码有毒信息，这使得这些语言模型有限的真实应用。目前的方法旨在防止出现有毒功能出现生成的文本。我们假设在预训练的语言模型的潜在空间中存在低维毒子空间，其存在表明有毒特征遵循一些底层图案，因此可拆卸。为了构建这种有毒的子空间，我们提出了一种方法来概括潜在空间中的毒性方向。我们还提供了一种使用基于上下文的Word Masking系统构造并行数据集的方法。通过我们的实验，我们表明，当从一组句子表现中删除有毒的子空间时，结果几乎没有毒性表现。我们凭经验证明了使用我们的方法发现的子空间推广到多个毒性Corpora，表明存在低维毒子空间。

translated by 谷歌翻译